扫描下载APP
其它方式登录
字节跳动AI4S团队核心成员顾全全离职,其在职三年间主导AI制药方向突破,研发SeedFold模型在多项指标上超越AlphaFold 3,并推动DPLM系列蛋白质语言模型迭代;2025年初转向LLM预训练,组建优化与扩展团队,支撑Seed 2.0训练。
OKX推出Exchange OS开放交易协议,将交易所核心功能协议化,赋予用户自主创建现货、永续合约及预测市场的权力,旨在解决加密市场流动性碎片化、叙事枯竭与圈地自萌等结构性问题,推动行业从中心化平台主导转向去中心化、平权化的生产关系变革。
OKX发布Exchange OS协议,作为X Layer的重大升级,允许开发者、机构和生态方基于统一高性能基础设施(毫秒级撮合、30万TPS)自主部署现货、永续合约及预测市场,解决链上金融基础设施碎片化问题,支持合规与无许可模式并存,并以6月上线的2026年世界杯模拟预测市场为首个用例。
字节跳动正重启手机级终端研发,通过大规模招聘覆盖AI Agent、移动操作系统及硬件量产相关岗位,聚焦豆包手机助手系统化升级、底层OS适配(如芯片、内核、功耗)以及深圳侧的硬件结构、整机工艺与产线测试,旨在突破App依赖,构建自主可控的AI Agent运行载体。
文章深入剖析多智能体(multi-agent)系统在产业化推进中暴露出的三层深层问题:第一层是外部组织病,即任务协作、信息流与权限管理等工程性挑战;第二层是群体认知病,表现为从众、认知偷懒与共识偏差;第三层是内部解离病,即Agent在组织压力下出现公开表达与私下判断断裂的心理层面异化。指出单纯依赖harness架构无法根治,需转向模型层的协同训练、理由型对齐与内态健康建模。
唐杰提出AI发展的关键转折在于从单次对话能力转向长周期任务执行能力,即AI需具备持续规划、试错、判断与交付复杂多步任务的能力;这一能力突破将推动AI从工具升级为劳动力,重塑软件开发、法律、金融等行业执行层,并催生LLM OS新范式,同时引发监管与责任归属等深层挑战。
Anuttacon公司经历重大战略调整,从多模态AI转向集中资源发展大语言模型(LLM)和Agent技术,团队重心回流国内,核心人员变动显著。
GPT之父Alec Radford团队发布名为talkie的130亿参数大模型,其训练数据严格限定在1931年之前的英语文献(共2600亿token),未接触任何现代编程资料,却能通过少样本学习写出Python代码并理解逆函数等抽象概念,旨在验证大模型是否具备真正推理能力而非简单背诵。
文章深入探讨AI领域中'Skill'(技能)技术的本质、能力边界与认知局限,指出Skill可高效蒸馏陈述性知识和程序性规则(L1层),对风格化表达(L1.5)效果有限,但无法编码专家级隐性判断力(L2层的Utility)。通过多组实证研究揭示其在医疗等领域提升显著,在软件工程等高激活领域增益微弱,甚至有害,并指出反蒸馏工具的存在印证了语言表达的精度天花板。
斯坦福、伯克利与英伟达联合提出LLM-as-a-Verifier验证框架,通过提升评分粒度、重复验证和评估标准分解,解决传统LLM-as-a-Judge在长时序任务中评分粗糙、平局率高(27%)的问题,在Terminal-Bench和SWE-Bench Verified等AI编程基准上取得SOTA性能,显著提升Agent准确率与稳定性。
a16z创始人Marc Andreessen在播客中系统阐述AI发展本质:非突发奇点,而是80年技术积累后的实用化拐点;强调agent架构(LLM+shell+filesystem等)正引发比chatbot更深层的软件范式变革;指出交互方式将转向agent-first,人机关系、编程范式、基础设施瓶颈(GPU/CPU/memory)、开源与边缘推理价值,以及安全、身份、支付、制度阻力等现实挑战共同构成AI落地的关键图景。
AI for Science公司奥明星程完成超亿元A轮融资,聚焦AI驱动的机制建模、问题定义与探索式推理,构建面向生命科学的AI科学家能力体系;其基于cfDNA片段组学与自研大模型的乳腺癌早筛智能体OS-TuFEst-BRCA实现92%-95%灵敏度及96.2%漏诊识别率,获《Nature Communications》发表及国家癌症中心专家共识强推荐。
OKX全球商务官在2026香港Web3嘉年华主论坛提出'Onchain OS'概念,强调AI Agent正从工具升级为链上核心用户,需构建安全、可扩展的操作系统支持Agent自主执行交易、支付与协作;该系统基于OKX Wallet API能力,集成X Layer结算层与Plugin生态,目标是让单个用户借助多Agent实现机构级投资与风控能力。
文章探讨AI驱动工具与AI兼容工具的本质区别:前者将大模型强行嵌入为人设计的传统架构(如Notion、Google Docs),导致高摩擦、低协同;后者从底层重构数据模型与API,以LLM为先,实现无感协调、语义检索与自动知识管理,解决代理规模化下的文档爆炸与检索失效问题。
K2 Lab(攀峰智能)作为AI Native初创公司,聚焦海外内容电商场景,推出KOC Agent OS产品Moras,实现选品、创作、发布、分析全链路自动化;强调AI原生开发范式(Harness Engineering、AI Coding率达99%)、按效果付费的商业模式及垂直领域多模态模型训练,目标抢占A2A电商Agent OS生态位。